871 रीडिंग

सामान्य वीडियो पहचान क्या है?

द्वारा Louis Bouchard6m2022/09/09

बहुत लंबा; पढ़ने के लिए

हमने देखा है कि एआई टेक्स्ट जेनरेट करता है, फिर इमेज बनाता है और हाल ही में छोटे वीडियो भी बनाता है, भले ही उन्हें अभी भी कुछ सुधार की आवश्यकता है। परिणाम अविश्वसनीय होते हैं जब आप सोचते हैं कि कोई भी वास्तव में इन टुकड़ों की निर्माण प्रक्रिया में शामिल नहीं है और इसे केवल एक बार प्रशिक्षित किया जाना है ताकि हजारों लोगों द्वारा स्थिर प्रसार जैसे उपयोग किया जा सके। फिर भी, क्या ये मॉडल वास्तव में समझते हैं कि वे क्या कर रहे हैं? क्या वे जानते हैं कि उन्होंने अभी जो तस्वीर या वीडियो बनाया है, वह वास्तव में क्या दर्शाता है? ऐसा मॉडल क्या समझता है जब वह ऐसी तस्वीर या उससे भी अधिक जटिल वीडियो देखता है? वीडियो में और जानें... (सस्ता जानकारी वीडियो में भी!)

featured image - सामान्य वीडियो पहचान क्या है?

हमने देखा है कि एआई टेक्स्ट उत्पन्न करता है, फिर चित्र बनाता है और हाल ही में लघु वीडियो भी बनाता है, भले ही उन्हें अभी भी कुछ सुधार की आवश्यकता है।

परिणाम अविश्वसनीय होते हैं जब आप सोचते हैं कि कोई भी वास्तव में इन टुकड़ों की निर्माण प्रक्रिया में शामिल नहीं है और इसे केवल एक बार प्रशिक्षित किया जाना है ताकि हजारों लोगों द्वारा स्थिर प्रसार जैसे उपयोग किया जा सके।

फिर भी, क्या ये मॉडल वास्तव में समझते हैं कि वे क्या कर रहे हैं? क्या वे जानते हैं कि उन्होंने अभी जो तस्वीर या वीडियो बनाया है, वह वास्तव में क्या दर्शाता है?

ऐसा मॉडल क्या समझता है जब वह ऐसी तस्वीर या उससे भी अधिक जटिल वीडियो देखता है? वीडियो में और जानें... (वीडियो में RTX GPU की सस्ता जानकारी भी है!)

संदर्भ

पूरा लेख पढ़ें:
https://www.louisbouchard.ai/सामान्य-वीडियो-पहचान/
नी, बी, पेंग, एच।, चेन, एम।, झांग, एस।, मेंग, जी।, फू, जे।, जियांग, एस। और
लिंग, एच।, 2022। सामान्य के लिए भाषा-छवि पूर्व प्रशिक्षित मॉडल का विस्तार
वीडियो पहचान। arXiv प्रीप्रिंट arXiv:2208.02816.
कोड: https://github.com/microsoft/VideoX/tree/master/X-CLIP
►माई न्यूज़लेटर (आपके ईमेल पर साप्ताहिक रूप से समझाया गया एक नया AI एप्लिकेशन!):
https://www.louisbouchard.ai/newsletter/